Keskustelu:Luettelo kielistä puhujamäärän perusteella

Wikipediasta
Siirry navigaatioon Siirry hakuun

Lähdekritiikkiä. Kannattaako näitäkin listoja ihan tuollaisenaan ottaa suoraan en-wikipediasta? Nyttenkin tuossa on kaiken maailman "Swiss Germanit" jne., jotka eivät ole edes omia kieliään. Pitäisiköhän meidänkin alkaa lisäämään tuohon suomen murteiden puhujamääriä? --SM 29. elokuuta 2005 kello 21.22 (UTC)

Riippuu siitä mihin kielen ja murteen raja vedetään. Selkeä linjaus ja yhdenmukaisuus ovat tietysti aina paikallaan.

Suomennoksia

[muokkaa wikitekstiä]

Suomensin seuraavat termit:

  • Indic = Indo-Aryan > indoarjalainen
  • Sundic > sundilainen
  • Malayo-Polynesian > malaijilais-polynesialainen
  • Iranian > iranilainen
  • Tai languages > tai-kielet
  • Austronesian > austronesialainen

Osa, mm. listan viimeinen, oli jo osittain suomennettu. Indic tarkoittaa englannin Wikipedian mukaan samaa kuin Indo-Aryan, joten suomensin sen samalla tavalla. Tässä joitakin apuna käyttämistäni veppisivuista:

Suomentamisen liäksi paljon työtä olisi kielten nimien muuttamiseksi pienellä alkaviksi. --Mikalaari 26. helmikuuta 2006 kello 20.56 (UTC)

Voisiko joku lisätä sijanumerot?

[muokkaa wikitekstiä]

Olisi hienoa nähdä suoraan, että kuinka moneksi puhutuin mikäkin kieli on.

Esimerkiksi laskin suomen kielen olevan sijalla 97. puhutuimmissa kielissä, ja ruotsin kieli oli 60-70 paikkeilla. Olisi kiva, jos sijoitus näkyisi valmiina. Tällöin säästyisi työläältä laskemiselta. 82.141.119.212 19. kesäkuuta 2006 kello 09.07 (UTC)


Englannin wikissä lista on myös puutteellinen ja eikä se sisällä kaikkia suomea suurempiakaan kieliä, suurin osa näistä lienee intialaisia tai kiinalaisia "pikkukieliä" joita kaikki eivät pidä omina kielinään vaan jonkun suuremman murteena... siinä suomi on sijalla 104. Ethnologue kirjaa 347 kieltä jota puhuu yli miljoona ihmistä, näitä siitä listasta puuttuu huomattavasti. ISO 639-3 standardi luetteloi kaikki kielet. mutta siinä listassa on puolestaan takuulla murteitakin.

http://www.ethnologue.com/ethno_docs/distribution.asp?by=size#3 listaa suomen kielen sijalle 124.

Ongelma on että kielen ja murteen ero on aina tulkintakysymys, usein myös poliittinen kysymys. Miten määritellä raja Wikipediassa ilman uutta tutkimusta? ISO 639 on hyvä yleisesti tunnustettu lähtökohta, mutta aina on tulkintatapauksia. Ovatko esim kirjanorja ja uusnorja eri kieliä? Niille on molemmille erilliset ISO-koodit, mutta myös yhteinen Norjan kieli-koodi. --LemonKing 19. helmikuuta 2011 kello 10.50 (EET)[vastaa]

Kehitysideoita

[muokkaa wikitekstiä]

Tämä luettelo on kumminkin sen verran keskeisestä aiheesta, että olis ihan kiva saada tää kuntoon. Olen vähän kausiluontoisesti yrittänyt tätä fiksailla, mutta yksin en ole pahemmin jaksanut. Saatan vertaisarvioittaa tämän, jos innostun puuhastelusta enemmän. Listaan varalta tähän kuitenkin, että mitä tälle suunnittelin ja mitä olen miettinyt.

  • Lähteistys. Kaikkiin pitäisi löytää joku viite. Ethnologuesta ei kaikkia kieliä löydy, mutta sieltä saa edes osalle. 10 miljoonasta alaspäin voisi käydä ensin Ethnologuen kanssa läpi, teen sen itse joskus jos kukaan ei ehdi ensin. Lopuille pitäisi keksiä jostain viitteet, sen verran mitä itse olen koittanut etisä, niin ei oikein löydy.
  • Päivitys. Osassa on useammalta vuodelta teidot, ne pitäisi tsekata niin että jätetään uusin (jossa on luotettavin lähde tai yleensä edes lähde). Samalla kielten järjestys pitäisi laittaa nykyisen tilanteen mukaan.
  • Muotoilut. Olisko parempi olla sortattava taulukko? Onko tämänhetkiset väliotsikot hyvät? Mun mielestä myöskään ei tarttis olla suluissa, että kuka sen laskennan on tehnyt, ethnologue-linkki tms. muu lähde riittää, että mistä se tieto on ihan oikeasti tänne otettu. --Velma 11. toukokuuta 2009 kello 10.57 (EEST)[vastaa]
  • Rajaus. Onko nykyinen artikkelin nimi hyvä vai olisko tätä parempi rajata jotenkin paremmin? Entä onko nykyinen alaraja eli 1 miljoona hyvä, pitäiskö laskea tai nostaa?

--Velma 11. toukokuuta 2009 kello 10.57 (EEST)[vastaa]

Tässä on aika monta asiaa, mitkä pitäisi ottaa huomioon. Ensinnäkin se, missä menee kielen ja murteen raja. Esimerkiksi nyt kiina on siellä yhdessä köntissä, vaikka käsittääkseni pitäisi puhua ennemmin kiinan kielistä (mandariini-, kantoninkiina jne.). Sitten se, onko kyse äidinkielestä vai myös toisesta kielestä; nyt siellä on "yhteensä"-lukuja, joissa on myös toisena kielenä puhujat mukana. Kolmanneksi lähdepohja, mistä löytyy edes suurin piirtein ajantasaista ja luotettavaa tietoa. Kun kuitenkin on niin paljon epävarmuustekijöitä, niin tarkkojen määrien antaminen on kyseenalaista, samoin kuin järjestykseen laittaminen.--Tanár 6. elokuuta 2009 kello 18.50 (EEST)[vastaa]

Tyypillistä wikisontaa: luettelo asiasta, joka ei ole luetteloitavissa (kuin ehkä kymmenen ensimmäisen osalta). Joutaisi poistoon. --Esamatti1 27. joulukuuta 2011 kello 12.16 (EET)[vastaa]

sijoilla 2-5 olevien määrät

[muokkaa wikitekstiä]

Eli tässä on 2. hindi 366, 3. englanti 341, 4. espanja 322, 5. arabia 206
En-wikissä 2. espanja 390, 3. englanti 365, 4. hindi 295, 5. arabia 280
Englanti on näistä kohtuullisen lähellä, muut aika kaukana. Kaipa niistä yhtä monta lukua kuin arvioijaakin, en tiedä pitäisikö sitten tehdä eri listat joka lähteelle? 91.154.189.74 3. elokuuta 2017 kello 06.02 (EEST)[vastaa]

Huomasin juuri, että jos en-wikin listan hindiin laskee mukaan urdun, saadaan 361 miljoonaa, joka on lähes sama kuin täällä, mutta täällä urdu kuitenkin erikseen... 91.154.189.74 3. elokuuta 2017 kello 06.06 (EEST)[vastaa]